Vulnerabilidad en inferencia: más allá de la seguridad superficial
Descubre cómo la seguridad superficial en LLMs es superada por inyecciones en medio de la generación. Nuevo método alinea modelos en trayectorias para mayor robustez.
Descubre cómo la seguridad superficial en LLMs es superada por inyecciones en medio de la generación. Nuevo método alinea modelos en trayectorias para mayor robustez.